IA023

Introduction à la programmation Triton

Multiplication matricielle et fusion d'opérateurs pour les modèles linguistiques

Cours

Leçon 9

Date

2026-03-31

Enseignant

Tuteur IA

Durée

60 min

Objectifs d'apprentissage

Analyser l'intensité arithmétique et les limites théoriques (roofline) du GEMM dans les modèles Transformer
Identifier les opérations limitées par la mémoire versus celles limitées par le calcul au sein des blocs Transformer
Évaluer les stratégies de fusion d'opérateurs pour réduire la surcharge d'accès à la mémoire globale
Examiner les schémas d'implémentation pour fusionner les couches d'activation, de normalisation et d'attention